JSAI2026 図表理解に基づく技術文書検索のためのRAGシステム - daiiz

JSAI2026 図表理解に基づく技術文書検索のためのRAGシステム

テーマ

技術文書検索において、図表を含むPDFから回答根拠ページを探すRAGシステムの研究

製造、ITインフラ領域

生成回答そのものよりも、適切な参照箇所をどう絞り込むかに重点がある

背景課題

技術文書では、似た表現でも利用場面が異なる情報が多い

ベクトル検索は意味的に近いが目的の違うページを拾いやすい

参照範囲を限定しづらい

BM25は型番・コードなどの厳密一致には強いが、同義語や言い換えに弱い

通常のチャンク検索では、章・節・図表などの文書構造が失われやすい

提案

文書を事前にLLMで解析し、構造化メタデータを作る

メタデータは2種類（ページ単位で読み込んで構築）

固定スキーマ

文書構造を表す

タイトル、概要、章・節ごとの要約

利用目的別スキーマ

トラブルシューティング、メンテナンスなどの目的ごとの情報

ある意味、大分類（親階層）を作っているようなものかも daiiz.icon

関連するページ番号も保持する

これを持っておくのいいアイデアだ daiiz.icon

検索時

単純な類似度検索はしない

LLMが目的と文書構造を見て段階的に絞り込む

検索フロー

ユーザ質問から利用目的を分類

カテゴライズ

目的に合う文書を選択

カテゴリに紐づく文書の特定

章節要約で大まかな範囲を絞る

ここでの検索手法は？daiiz.icon

利用目的別メタデータで関連ページを特定

該当ページをマルチモーダルLLMに渡し、図表も含めて回答生成

具体的には何を渡し、どのような表現でユーザーに返す？daiiz.icon

→ ページ単位でPDFファイル（画像として）をそのまま渡す

これは提案手法の範疇外かも

評価

ViDoRe Benchmark: Industrial reports

技術文書5244ページ、質問100件（さらに多く）で評価

比較対象: Vector-based RAG と BM25

指標: Precision / Recall / F1

この研究もRetriever性能を検証することにフォーカスしているな daiiz.icon

結果

提案手法

検索関連メトリクス（P / R / F1）で優位

RAG

順位付け、回答品質（MRR / Answer Correctness / Success ）で優位

文書構造と利用目的で絞り込むことで、目的外の類似ページを減らせた